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Аналізується складність за кількістю однослівних операцій при реалізації операції ЦЗ (циклічної 
згортки) у паралельній моделі обчислень. Розглянуто методи обчислення ЦЗ, коли кожна точка згортки є 
багаторозрядним числом. Запропоновано швидкий метод обчислення ЦЗ такого виду на основі ШПФ не- 
великої довжини. 
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Вступ 

У багатьох задач цифрової обробки (ЦО) необхідно обчислювати циклічну 
згортку (ЦЗ). Деякі задачі ЦО можна звести до задачі обчислення ЦЗ. Оптимізації 
обчислення ЦЗ приділено багато уваги |Ї, 2|. При обчисленні згорток великої довжини 
(більше 1024 точок) з використанням звичайної арифметики з плаваючою комою оди- 
нарної (або подвійної) точності накопичується похибка заокруглення. Якщо похибка 
заокруглення є великою, то вона впливає на результат обчислення так, що результат 
обчислення втрачає достовірність |3|. Для уникнення похибки заокруглення, необхідно 
оперувати більшою кількістю розрядів у кожній операції. Використання операцій з 
більшою розрядністю значно уповільнює виконання багаторозрядної операції. 

Сучасні процесори дозволяють виконувати операції над числами, довжина яких 
не перевищує 64 біти (подвійна точність) на апаратному рівні. Роботи (4, 5| присвячені 
оптимізації обчислення ЦЗ, але з точністю операцій процесора. Для отримання більшої 
точності, необхідно використовувати спеціальну арифметику, реалізовану на 
програмному рівні. 

Окрім ЦО, згортка використовується для реалізації операцій багаторозрядної 
арифметики |3)|. При реалізації криптографічних операцій найбільше навантаження 
лягає на операцію багаторозрядного множення. У роботах |4, 5| показано метод обчис- 
лення операції множення на основі ЦЗ. Найбільш швидкий метод реалізації багатороз- 
рядної операції множення базується на ШПФ (швидкому перетворенні Фур'є). 

Метод множення «у стовпчик» є ефективним при множенні багаторозрядних чисел з 
кількістю слів М «256 (де кожне слово має довжину у 32 біти), Метод ШПФ є 
ефективним, починаючи з М 2256. Операція множення двох чисел довжиною М - 256 
слів може бути реалізована на основі ШПФ довжиною 2М - 512 (метод Кулі-Туки). 
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При цьому треба враховувати, що при обчисленні ОШІПФ (оберненого швидкого 
перетворення Фур'є) необхідно виконувати ділення на 2М - 3512. При діленні на 512 
відбувається зсув на 1Іоє,312 -9 бітів. В операціях одинарної точності (32 біта) 


мантиса займає 23 біти. Тобто, після ділення на 512 (або зсуву вправо на 9 бітів) 
залишається 14 - 23-9 значущих бітів, що говорить про те, що на початку обчислень 
враховується тільки 7 значущих бітів, бо при кожному множенні довжина результату 
подвоюється, а кожне подальше додавання може збільшувати результат на один біт. 
Так, наприклад, при використанні 8 значущих бітів на початку обчислень після 
першого множення результат буде займати 16 значущих бітів. Якщо обчислення 
відбувається, наприклад, для обчислення ЦЗ довжиною 256 (8 бітів) точок, то після 3-ої 
ітерації ШПФ кількість заповнених значущих бітів буде більшою, ніж 24. 

При використанні операцій подвійної точності (64 біти) довжина мантиси складає 
51 біт. Тобто, на початку обчислення ШИПФ кількість значущих бітів не повинна 
перевищувати 21-(51-9)/2 при множенні 256-слівного числа на основі ШПФ 


довжиною 512. Зрозуміло, що при множенні чисел довжиною більшою, ніж 256 слів, 
кількість значущих бітів повинна бути меншою, ніж 21, для уникнення переповнення. 
Виходячи з попередніх міркувань, множення на основі ШПФ є найшвидшим 
методом, але існує апаратне обмеження довжини множників у 256.21 - 5376 бітів, які 
можна перемножити на основі ШПОФ, використовуючи операції подвійної точності. При 
реалізації множення чисел більших, ніж 5376 бітів, на основі ШПФ, мантиса повинна 
мати більше ніж 31 біт для уникнення переповнення. Виникає потреба використання 
арифметики з точністю, більшою ніж подвійна, яку необхідно реалізовувати програмно. 
На практиці це виглядає так, що багаторозрядне число ділиться на М секцій, де кожна 
секція займає більше ніж 128 бітів. Довжина ШПФ, на основі якої виконується 
обчислення, дорівнює числу секцій У. Можна використовувати різні методи 
обчислення для кожного «рівня». Один метод використовувати для реалізації 
багаторозрядної операції множення для М (множник з М секцій), а інший метод - для 
оперування розрядами для М (кожна секція складається з М слів, кожне з яких має 32 
біти). Метод на основі ШПФ буде найефективнішим при довжинах, більших ніж 256 
секцій (для рівня М ) та 256 слів (для рівня М). Для довжин, менших ніж 256, для 
рівнів М та М метод на основі ШПФ програє методу множення «у стовпчик». 
Загальноприйнято, що ШПФ треба використовувати, коли довжина ШПФ 
перевищує 256 точок. У даній роботі показано, що використання ШПФ довжиною 16 є 
ефективним при обчисленні ЦЗ великих чисел. Запропонований метод дає меншу 
складність за кількістю однослівних операцій у порівнянні з методом «у стовпчик». 
Одним з методів прискорення обчислення багаторозрядних операцій є їх 
реалізація у паралельній моделі обчислення, окрім використання швидких методів, які є 
ефективними у своїх діапазонах довжин багаторозрядних чисел. Може здаватися, що 
при задіянні У паралельних процесорів, можна прискорити час виконання у М разів. 
Але, на практиці, це зовсім не так. По-перше, не всі методи можна розпаралелити. Так, 
деякі методи мають пов'язані кроки обчислення, коли наступний крок обчислення 
оснований на результаті попереднього і не може бути виконаний незалежно від інших 
кроків. По-друге, при більшій кількості задіяних процесорів необхідно враховувати 
більше обмежень. Так, наприклад, розмір кеш-пам'яті є постійним і збільшення 
кількості процесорів означає, що кожному процесору буде виділено менше кеш- 
пам'яті. При розбитті процесорів у групи, необхідно виконувати синхронізацію між 
групами, що є дуже витратною операцією. При ще більшому збільшенні кількості 
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процесорів необхідно враховувати, що кожен паралельний процесор потребує енергію. 

Далі у роботі багаторозрядними числами будемо називати числа, які займають 
більше ніж два слова у пам'яті комп'ютера. Великі цілі числа є багаторозрядними чис- 
лами. Далі у роботі використовується термін багаторозрядні числа без розділення на ве- 
ликі цілі числа та числа з плаваючою комою з великою мантисою. Отримані у роботі 
результати можуть бути використані як для оптимізації обчислень з великими цілими 
числами, так і для реалізації операцій для отримання більшої кількості розрядів після коми. 

Мета дослідження 

Метою даної роботі є знаходження швидкого алгоритму обчислення циклічної 
згортки багаторозрядних чисел у паралельній моделі обчислення. Швидкий алгоритм 
має бути ефективним, використовувати максимально кеш-пам'ять та векторні операції 1 
задіяти невелику кількість паралельних процесорів для зменшення обсягу викори- 
стання електроенергії при реалізації у паралельній моделі обчислень. Для цього прове- 
дено аналіз складності реалізації операції циклічної згортки багаторозрядних чисел на 
основі двох методів реалізації багаторозрядної операції множення: множення «у 
стовпчик» та на основі ШПФ. Досліджено область диференційованої поведінки алго- 
ритмів на основі двох методів. Показано, що запропонований метод на основі ШПИФ 
невеликої довжини є ефективним для умов, коли багаторозрядне число займає не 
менше восьми слів. 

Постановка задачі 


Нехай багаторозрядні числа Х,, У, і- 0,М - 1 складаються з М секцій. Кожна і 
секція є М-слівним числом, у свою чергу, де кожне число має довжину У /(2-біт. 


Необхідно побудувати швидкий алгоритм обчислення циклічної згортки довжиною М 
секцій, де кожна секція є М -слівним числом, у паралельній моделі обчислень: 


М поему 
ве У СХ; урорабдмтнні,, а) 


іч 
г ім 
де К, - 2М -слівне число. 


Наприклад, обчислення ЦЗ ЕК, - Х, 9У, довжиною М «4 розрядів можна 
представити у наступному вигляді: 


Хо Ї, Ї, Ї, Ї, 
мії ї 5 У 
Х, Ї, Ї, Ї, Її, 
Х, Ї, Ї, Ї, Ї, 

К, В В, В, 


Рис. 1. Обчислення ЦЗ довжиною у 4 точки 


Вираз (1) може бути обчислений, використовуючи метод «у стовпчик» при 
реалізації багаторозрядної операції множення. Розглянемо складність такої реалізації у 
паралельній моделі обчислень. 

еалізація на основі множення «у стовпчик» 

Знайдемо спочатку складність алгоритму множення двох М -слівних чисел ХУ 
стандартним методом «у стовпчик». Для спрощення у наступному алгоритмі (і далі по 
тексту) вважаємо, що знак переносу у 2М--Ї слово не виникає. Множення «у 
стовпчик» двох /М-слівних чисел Х-Ї можна представити у вигляді наступної 
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формули: 
К 
2м-1 Уа «Ура НТ 
ве У (п 2"), пре б, , 
і УК) кам 
тек-Мчі 

де К - 2М -слівне число. 
Використаємо наступні позначення: Н(5) з 5,, (5) з 5, - знаходження старшої 


та молодшої частин двослівного числа 5 - 5,2" 450: 


Алгоритм 1. Множення М -слівних чисел Х.У стандартним методом «у 
стовпчик» при задіянні М -паралельних процесорів без врахування знаків переносу. 


М-1 М-1 
На вході: Х «У (х, 29), У «У (у, 27), р - індекс процесора. 
кад кад 


2М-1 
На виході: К- ЗВ -298) - результат множення ХУ. 


ке 
Крок 1. 7, он 9-0. // Ініціалізація 
Крок 2. Для Кк -0 по М- 1 
Крок 3. знезчн, ЗУ // Множення 
Крок 4. Го Я Трек Я 205)» Гоа 2 При У НО5). // Додавання 


Крок 5. Кінець циклу по (. 


Примітка. Алгоритм 1 не є оптимальним за кількістю операцію запису у пам'ять. 
Головною метою  Алгоритму 1 є представлення загальної кількості операцій, 
необхідних для реалізації багаторозрядної операції. 


Лема 1. В Алгоритмі 1 при множенні двох М -слівних чисел стандартним 
методом «у стовпчик» кожен з М паралельних процесорів виконає М однослівних 
операцій множення та 2 однослівних операцій додавання. 

Доведення. На кроках 2-5 необхідно виконати М ітерацій циклу. З врахуванням 
того, що результатом множення двох однослівних чисел є двослівне число, необхідно 
виконати у два рази більшу кількість однослівних операцій додавання. Лема доведена. 

Далі розглянемо алгоритм, який обчислює циклічну згортку (1), при задіянні ММ 
паралельних процесорів. Алгоритм знаходить суми добутків У -слівних чисел 


жа 


Как? 


стовпчик». 


і-0М-1, )-0,М -1, на основі стандартного методу множення «у 


Алгоритм 2. Знаходження суми добутків М -слівних чисел на основі методу 
множення «у стовпчик» при задіянні М.М паралельних процесорів без врахування 
знаків переносу. 


На вході: Х., . ,і-0,М - Ї; 
)є0,М -1 - індекси ряду та стовпчика групи процесорів, яку можна 


інтерпретувати у вигляді матриці. 


М- 
На виході: ва УСХИїа ), ,/20,М-1. 


із0 
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Крок 1. К,«-0. // Тніціалізація 
Крок 2. Для і-0 по М - 1 

Крок 3. Кот С РЕ // М -слівне множення 
Крок 4. Кінець циклу по 1. // на основі Алгоритму 1 


Лема 2. В Алгоритмі 2 при знаходженні сум множень ЛУ -слівних чисел на основі 
методу множення «у стовпчик» кожен з М.М паралельних процесорів виконає ММ 
однослівних операцій множення та 2М.У однослівних операцій додавання. 

Доведення. Згідно з Лемою І при множення двох У -слівних чисел необхідно 
виконати М однослівних операцій множень та 2 однослівних операцій додавання. 
Таких ітерацій необхідно виконати М . Лема доведена. 

Реалізація на основі ШПФ 

У даній роботі пропонується обчислювати ЦЗ (1) великих чисел, використовуючи 
метод множення на основі ШПОФ, у паралельній моделі обчислень. 

Розглянемо алгоритм множення М -слівних чисел Х -У на основі ШПФ довжини 
2М . Обчислення на основі ШПФ можна представити наступним чином: 


ве У ззуак Ран Рух (3,2) о) 


де Й гу ТА Йо у - матриці ДПФ та ОДПФ, які складаються з елементів 
2лі 


т Аа реенанань ванни З Й 
АН зе ,Кк,гое02М-1; 2 складається з М нульових слів. 


Лема 3. При множенні двох М -слівних чисел на основі ШПФ довжиною 2М 
кожен з М паралельних процесорів виконає 2- 3106, 2М комплексних однослівних 
операцій | множення | та | 24 6іо5,2М комплексних  однослівних операцій 


додавання/віднімання. 
Доведення. У (2), для виконання одного ШПФ(ОШПФ) довжиною 2МУ, 


необхідно виконати 1Іоє,2М ітерацій ШІПФ. На кожній ітерації «метелика»! 
виконується М комплексних множень, результати яких додаються/віднімаються до/з 
2М комплексних елементів. Загалом, кожен паралельний процесор виконає 106, 2М 
комплексних | операцій | множення та  2106,2М комплексних операцій 
додавання/віднімання при обчисленні одного ШПФ (ОШПФ). Усього необхідно 
виконати два ШПФ та одне ОШПФ. Також, кожному з М процесорів необхідно 
виконати додатково по дві поелементні комплексні операції множення. Лема доведена. 
Представимо (1) для / «0 у наступному вигляді з врахуванням (2): 


М 


1 » 
Ко Мо 2 ана "ТР ау Р.РУДУН ЯМУ (5, 2)))). 


із0 


у 1 - . ; і 
У попередньому виразі множник м анамо що відповідає операції ОШПОФ, 


можна винести за знак суми, що значно спрощує обчислення. 


| «Метелик» - стандартна операція алгоритму ШПФ. 
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1 - м 
Вр Є ох Пана Тан СХ 2) (Так (0,2). (3) 
із0 


Окрім (3), можна отримати ще більше спрощення при реалізації операції 
багаторозрядного множення на основі ШІИФ при обчисленні (1), якщо передобчислити 


А 


всі ДПФ Х,, у /- 0,М -1. Використовуючи передобчислені ДПФ Хо, у 


/ 2 7? 


ма, 


)20,М -1, можна швидко знайти суми добутків ДПФ В, «- УС я ри ), 
і-0 п 


. : - . 1 ж г 
)20,М -1, а потім на їх основі обчислювати елементи ЦЗ К «----Йоузу: ВК, 
7 2М і є 


7-0, М - 1. На прикладі обчислення ЦЗ довжини чотири, пропонується одним з кроків 
виконувати наступне обчислення: 


Є Я Я / й 
ко вок, к, 


Рис. 2. Обчислення ДПФ елементів ЦЗ довжиною у 4 точки 
На рис. 2 Хо, Х,, раРи ря Я ЗВ АЙ - В, Кк» со ЕВ, є ДПФ відповідних 
елементів ЦЗ Х,, Х,, Х,, ХХ», Ї,, У, У», У, КК, ВК», К, (див. рис. 1). У кожному 
стовпчику елементи ок ри 4 5 А циклічно повторюються. Тому замість 16 ШПФ, у 


яких використовуються ї,, ри зай їі їх достатньо передобчилити І раз. Таким чином, 
для обчислення ЦЗ (1) довжини 4 (рис. 1) на основі ШПІФ (рис. 2) необхідно 


А 


передобчислити 8 ДПФ Х,, Ї,, / - 0,3, та обчислити 4 ОШПФ В, «- Ра ХК 


/? 
720,3. Загалом, необхідно виконати 12 ШПФ(ОШІПФ) замість 32 ШПФ (16 


багаторозрядних множень) та 4 ОШПФ. 
Розглянемо загальний випадок, коли необхідно обчислити М сум, у яких 


використовуються Х,, У, . ,і-0,М - 1, 7-0,М - 1: 
р У і (ім / 


1 М 
К, ето, і 2 нах ТРРУДУН С ДР "Ки, ,2))) ? 


720М-1. (4) 

Лема 4. При знаходженні сум (4) співмножників М -слівних чисел на основі 

ШПФ довжини 2МУ, кожен з М.М паралельних процесорів виконає 2М ч 3105,2М 

комплексних однослівних операцій множення та 2М -3-:21о5,2М комплексних 
однослівних операцій додавання/віднімання у послідовній моделі обчислень. 

Доведення. У (4) необхідно передобчислити 2М ШПОФ для Х,, У, і-0,М - 1, 


та обчислити М ОШІФ довжини 2М. Згідно з Лемою 3, при задіянні процесорів, 
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кожен з процесорів М при обчисленні одного ШПФ (ОШПФ) виконає Іоє, 2 
комплексних операцій множення та 21і08,2М комплексних операцій додаван- 
ня/віднімання. Також, кожен з М процесорів виконає додатково по два поелементних 
комплексних множення при реалізації багаторозрядної операції множення на основі 
ШПОФ,. Таких додаткових обчислень необхідно виконати М . Лема доведена. 

Порівняння методів 

Далі порівняємо складності обчислення ЦЗ (1) за кількістю однослівних операцій 
при реалізації багаторозрядної операції множення на основі методу множення «у 
стовпчик» (Лема 2) з реалізацією (4) на основі ШПФ (Лема 4) для одного процесора в 
багатопроцесорній моделі обчислень. Знайдемо агреговані коефіцієнти кількості 
операцій додавання/віднімання та множення. 

Агрегований коефіцієнт для Леми 4 може бути виражений наступним чином: 


ОМ, М) «4О(М, М) 2 (2 ОМ, М) НОМ, М)), (5) 


де О(М,М), О(М, М) - загальна кількість комплексних однослівних операцій 
множення та додавання/віднімання у Лемі 4. 

Коефіцієнт 4 у доданку 4:О0,(М,М) та коефіцієнт 2 у доданку 2:0,/(М,М) у 
співвідношенні (5) позначають, що для реалізації однієї операції множення над 
комплексними числами необхідно чотири однослівні операції множення над дійсними 
числами (алгоритм Винограда дозволяє це зробити за три операції) та дві комплексні 
операції додавання. Двійка перед скобками у доданку 2.(2: 0, (М, М) - О (М, М)) 
означає, що комплексні числа мають дійсну та уявну частини, тому для їх реалізації 
необхідно використати у два рази більшу кількість операцій над дійсними числами. 
Вважаємо, що однослівні операції додавання та множення над дійсними числами 
займають однаковий час за швидкодією. Після розкриття дужок, отримуємо наступний 
вираз: 


О, (М, М) «8:ОГ(М, М) 2:ОГ(М, М). 

Після використання Леми 4, отримаємо наступне співвідношення: 
ОСМ,М) «8 (2М 3109, 2М)ч2(2М 32108, 2М). 

Після спрощення, отримуємо наступний агрегований коефіцієнт: 


ОМ, Му 20М я 3біов, ом. 


Агрегований коефіцієнт Леми 2 дорівнює 0,(М, М) « ЗММ , вважаючи, що час 


виконання операцій множення та додавання/віднімання на сучасних комп'ютерах 
однаковий. 

Знайдемо умови, при яких запропонований метод на основі ШПФ (Лема 4) є 
більш ефективним, ніж метод, заснований на методі множення «у стовпчик» (Лема 2), 


тобто 0, (М, М)«О,(М, М). 


С ОС(М,У) ЗМУ 
МО ОЦМ,М) 20М -Збіов, ЗМ. 
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М 

М 4 8 16 32 64 128 256 

1 0,09375 | 0,14634 | 0,4000 | 0,0678 | 0,70588 | 1,24675 2,23256 
2 0,16216 | 0,26087 | 0,43636 | 0,75000 | 1,31507 | 2,34146 4,21978 
3 0,241429 | 035294 | 0,60000 | 1.04348 | 1,84615 | 3,31034 600000 
4 0,25532 | 0,42857 | 0,73846 | 1.29730 | 231325 | 4,17391 7,60396 
5 0,28846 | 0,49180 | 0,85714 | 1,51899 | 2,72727 | 4,94845 9,05660 
6 0,31579 | 054545 | 0,96000 | 1,71429 | 3,09677 | 5,64706 10,37838 
7 0,33871 | 0,59155 | 1.05000 | 1.88764 | 3,42857 | 6,28037 11,58621 
8 0,35821 | 0,63158 | 1.12941 | 2.042553 | 3,72816 | 6,85714 12,69421 
16 0,44860 | 0,82759 | 1.53600 | 2.86567 | 5,37063 | 10,10526 | 19,08075 


32 0,51337 | 0,97959 | 1.87317 | 3,58879 | 6,88789 | 13.24138 | 25,49378 
36 0,52174 | 100000 | 1.922000 | 3.,69231 | 7,11111 | 13,71429 | 26,48276 
37 0,52358 | 1,00452 | 1.93043 | 3,71548 | 7,16129 | 13.82101 | 26,70677 
64 0,55331 | 1,07865 | 2.10411 | 4.10695 | 8,02089 | 15.,67347 | 30,64339 
128 0,57571 | 1,13609 | 2.24234 | 4.42651 | 8,73969 | 17.25843 | 34,08599 
256 0,58761 | 1,16717 | 2.31849 | 4.60570 | 9,14966 | 18,17751 | 36,11462 
512 0,59374 | 1,18336 | 2.35854 | 4,70084 | 9,36942 | 18.67477 | 37,22226 
1024 | 0,59685 | 1,19162 | 2,37909 | 4,74990 | 9.48331 | 18,93374 | 37.80196 


Аналізуючи табл. 1, бачимо, що при обчисленні циклічної згортки довжини М 
багаторозрядних чисел довжиною МУ слів, запропонований метод є ефективним, 
починаючи зі згорток, довжиною у М 2 37 точок та багаторозрядних чисел з У 28 (у 
32.3 - 256 бітів) слів на початку обчислень. 

Цікаво, що коефіцієнт прискорення у паралельній моделі повністю співпадає з 
коефіцієнтом прискорення у послідовній моделі за однакових умов (однакових М , М). 
Зазвичай, коефіцієнти прискорення для різних моделей обчислень відрізняються. 

Висновок 

У даній роботі проаналізовано складність обчислення ЦЗ (циклічної згортки) 
багаторозрядних чисел за кількістю однослівних операцій (множення, додавання та 
віднімання) у паралельному модулі обчислень. На основі ЦЗ можна побудувати 
швидкий алгоритм багаторозрядної операції множення. Розглянуто два методи 
обчислення циклічної згортки з реалізацією багаторозрядної операції множення на 
основі множення «у стовпчик» та на основі ШПФ. Надано алгоритми реалізації 
операції множення на основі двох методів у паралельній моделі обчислень. 
Запропоновано швидкий метод на основі ШПОФ, який дозволяє реалізувати обчислення 
циклічної згортки багаторозрядних чисел зі складністю, меншою, ніж складність на 
основі методу множення «у стовпчик». Розглянуто умови, при яких ШИФ є швидким. 
Показано, що використання ШИФ довжиною 16 є вже ефективним при обчисленні ЦЗ, 
починаючи з довжин згортки у 37 точок, де кожна точка є багаторозрядним числом у 8 
слів (256 біт) на початку обчислень. Програмна реалізація на СРО (графічних 
прискорювачах) для ядра (паралельного процесора) на основі ШПФ довжиною 16 
дозволяє виконати обчислення з використанням векторних операцій довжиною 16, що 
дозволяє будувати ще більш швидкі алгоритми. 

При реалізації алгоритму на основі ШПФ, знаки переносу між машинними 
словами необхідно враховувати тільки на етапі обчислення ОШПФ, що є перевагою, у 
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порівнянні з реалізацією алгоритму на основі множення «у стовпчик», коли знаки 
переносу необхідно враховувати на всіх етапах обчислення ЦЗ багаторозрядних чисел. 
Це також дає перевагу при реалізації у паралельній моделі обчислень, де операції 
врахування знаку переносу можуть займати більший час, ніж всі інші операції загалом. 

Довжини багаторозрядних множників при реалізації множення на основі ШПФ 
обмежені довжиною машинного слова, яку може обробляти процесор за одну команду. 
Запропонований метод дозволяє будувати алгоритми множення ще більших 
багаторозрядних чисел на основі ШІПФ, яка використовується для обчислення 
циклічної згортки, що саме реалізує багаторозрядну операцію множення у паралельній 
моделі обчислень. 
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ВЕ5ОМКЕ 

А.М. Теге5ісрепко, У.К.7 адігака 

Ка5зі ргосеедїпе ої сусіїс сопуоішбіоп ої піиійаїяєії уаїше5 Баз5еай оп ККТ іп рагаїіеї 
сотрикабіопа! тодеї 
І Фіз8 рарег Фе сотріехту ої саїсиціайоп ої Ше сітсиіаг сопуоГийоп ої пли шаяїї уаїше8 їп 
їегта5 ої 5іпеЇе ргесізіоп орегайопя (плиїрісацоп, аддіїйоп апа 5ибігасйоп) іп рагаПеї 
сотриїайопаї тодеі 15 апаїугей. Ва5ед оп їБе сігсиіаг сопуоїийоп Бе Таз аїсогійрт ої 
пит: пайорісайоп сопід бе Бий. Ту сігсиіаг сопуоїийоп саїсиіайоп теїродя ут 
Фе шпріетепіайоп ої пацінаїєті пацібрізсайоп Ба5ей оп паційрісабоп "їп Ше согатип" апа 
ра5ед оп ЕЕТ е сопзідегед. Ргоуїдед аїсогіїртів ітріеплепі піціпаїєії плиїаріїсайоп 
орегайоп Ба5ей оп бо теїодз8 їп рагаїе! сопариканопа! плодеі. А гарід тефодй Базед оп 
ЕЕТ саїсціайоп аПому5 ітріетепіпоя Бе саїсиіайоп ої сусіїс сопуоіиійоп ої паціндїбії 
уаїшеє ул согаріехіїу Іе55 ап соппріехіїу ої птмеїпод Ба5ед оп плиїпрійсайоп "їп Ше 
сопитп." Тре сопаїопя ппдег урбісіп Бе ЕКТ 18 Мазі аге соп5ідегеай. П 15 5ромуп Фаї цз5іпе 
ЕЕТ Іепеі ої 16 і5 ебесйуе їп саїсціайтя сігсиціаг сопуоЇийоп 5кагіїпе, гот Фе Іепєїр ої 37 
роїпі8, уУБеге еасі роїпі 15 а паційаїсїс уаїше ої бе Іспоп ої 3 могая (256 біз) їп Ше 
регбіпаіпеє ої сопаршайоп. З5оїїмаге ппріетепіайоп оп СРО Баз5ед оп ЕЕТ Іепеїр ої 16 
аПом/8 п5іпе, СРО уесіог орегайопз5 ої Бе Іепеїї ої 16 Баг зреедз пр аїсогіта 5рагріу. 
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Оп шріетепійпе Ше аїсогіїрйт Базед оп ЕЕТ Ше сагу Пає Бебуєеп пасріпе м/огая 15 (акеп 
їпіо ассоцпі опіу аг ре 5іаєе ої саїсціайтє ТЕЕТ, мПісі 15 ап адуапіаєє сотрагей іо Ше 
аїєогійрт Базед оп паційрісайоп "іп пе соїштп" м/пеп Фе сапу Нає 15 соп5ідегеай аї аї! 
зіабез ої сопприкайоп. Пі аї5о ріуеє адуапіаєє ої ітріетепіїпє оп рагаПе! соприканопа! 
тодеї мПпеп орегайоп ог какіпя саге ої сапу Пає плау їаке плоге те їБап ай! Фе офег 
орегайоп5 їп бепегаї. 
Тре Іепе05 ої плиїнаїдїї паційбрпег8 їп бе ітріетепіайоп ої піційріїсайоп Базед оп ЕЕТ 
Ппаей бу Фе Іспеїб об (Фе паасріпе мога ргосеззог паї сап ргосе55 їп а 5іп9Їе сопатата. 
Тре ргоробед пеїродй Бгоадепз із гебігісбоп апа аПомз Бийдпє аїсогіїйтя Базед оп ЕЕТ 
Бог тисі Ббієдег питрег5. 

Надійшла до редакції 04.09.2016 
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